其他
三分钟掌握文件格式识别
fleep是一个为Python而写的检测文件类型的库,用法十分简单,功能强大。
使用方法
fleep有一个主函数get(),该函数提取128bytes就能判断一个文件的格式信息。
get()返回的对象有以下几种方法:
type() 返回文件类型列表,如图片、文档、可执行文件、压缩文件
extension() 返回文件格式列表,如图片中有jpg、png、jpeg
mime 以上两种信息都提供,如 image/png
get返回的对象,还能提供检测文件类型与格式,返回布尔值:
type_matches() 检测文件类型,,返回布尔值
extension_matches() 检测文件格式,返回布尔值
mime_matches() 检测文件类型与格式,返回布尔值
使用示例
import fleep
with open("png_image", "rb") as file:
info = fleep.get(file.read(128))
#文件类型
print(info.type) # ['image']
#文件类型的具体信息(如图片中,具体可分为jpg/png/gif等)
print(info.extension) # ['png']
#文件类型及具体类型信息
print(info.mime) # ['image/png']
#检测是否为某种文件类型,返回布尔值
print(info.type_matches("image")) # True
#检测是否为某种具体的文件类型,返回布尔值
print(info.extension_matches("gif")) # False
#检测是否为文件类型及具体类型信息,返回布尔值
print(info.mime_matches("image/png")) # True
支持的格式
Image
bmp、gif、ico、jp2、jpeg、png、psd、webp
Video
avi、flv、mkv、mp4、mpg、wmv
Document
doc、docx、epub、pdf、ppt、xls、xlsx、xml
Executable
com、exe、jar
System
cab、cat、dll、sys、sdb、drv
Database
sqlite
数据采集